##  Exerccio 4


cervejas <-c("chope","lata","garrafa","chope","garrafa", "garrafa","lata","lata","nenhuma","lata","garrafa","garrafa", "garrafa","lata","lata","lata","garrafa","lata","chope","nenhuma", "garrafa","garrafa","garrafa","chope","garrafa","garrafa","chope","garrafa","lata","lata")
cervejas
class(cervejas)

# criar grficos

cervejas.table=table(cervejas)# colocando em uma tabela
cervejas.table
dotchart(cervejas.table)# grafico dotchart
barplot(cervejas.table) #grafico de barras
# O grafico de barras gasta mais tinta !

# Rios
search()#vendo pacotes- datasets encontrado
data(rivers)
rivers# conhecendo os dados
class(rivers)
summary(rivers)

#rios menores do que a mdia

media.rios=mean(rivers)
media.rios # igual a mdia do summary, incrvel !
menor.media=c(rivers<media.rios)# teste lgico - rios menores que mdia = TRUE
menor.media # verificando...
table(menor.media)# tabela - 94 rios so menores que a mdia
barplot(rivers)

## quantil de 75%
summary(rivers)# o 3rd  o quartil de 75% 
quantile(rivers)# ou tambm podemos ver com a funo quantile !
#  O quantil em ambos  igual a 680  =)

#Mdia, mdia truncada e a 25% e mediana
media.r= mean(rivers)#591.1844
class(media.r)
mediana.r=median(rivers)#425
help(mean)#trim the fraction (0 to 0.5) of observations to be trimmed from each end of x before the mean is computed. Values of trim outside that range are taken as the nearest endpoint.  
truncada=mean(rivers, trim=0.25)# calculada retirando uma % igual dos dados dos dois lados da curva 
truncada#449.9155
# Comparando

media.r-truncada#144.269
truncada-mediana.r#24.915149

# a mdia parece ser mais afetada pelos valores extremos, como a mediana
# fica no meio dos dados independente dos valores e a mdia truncada "joga"
# % iguais de valores dos dois lados ela  pouco afetada 


# Caixetais

caix=file.choose()
caixetais= read.table(caix,header=TRUE, sep=",", as.is=TRUE, dec=".")
str(caixetais)
head(caixetais)# ok
help(hist)
args(hist)
hist(caixetais$cap) # histograma
 
# alturas pra locais diferente -Construa histogramas da altura das rvores para os diferentes caixetais ('local').

loc=caixetais$local
loc
class(loc)
table(loc)# vendo quantas obs tem em cada local
help(par)
par(mfrow=c(3,1))

#chauas
help(hist)
chauas=hist(caixetais$h[caixetais$local=="chauas"], main="chauas",xlab="altura",ylab="frequencia")
#jureia
hist(caixetais$h[caixetais$local=="jureia"], main="jureia",xlab="altura",ylab="frequencia")    
#retiro
hist(caixetais$h[caixetais$local=="retiro"],main="retiro",xlab="altura",ylab="frequencia")
hist(prob=TRUE)
#h diferenas na estrutura ?
#Aparentemente jureia e retiro possuem uma ditribuio normal e chauas apresenta 
#uma distribuio concentrada ao lado esquerdo da curva, em valores pequenos
# mas...
qqnorm(caixetais$h[caixetais$local=="jureia"])
qqline(caixetais$h[caixetais$local=="jureia"])

qqnorm(caixetais$h[caixetais$local=="retiro"])
qqline(caixetais$h[caixetais$local=="retiro"])

qqnorm(caixetais$h[caixetais$local=="chauas"])
qqline(caixetais$h[caixetais$local=="chauas"])
#nenhum  ! pelo menos no parece para mim !

# Eucaliptos

e.grandis=file.choose()
args(read.table)
e.gran=read.table(e.grandis,header=TRUE, sep=";", dec=".",as.is=TRUE)
str(e.gran)
head(e.gran)#leitura ok

help(boxplot)
boxplot(e.gran$dap~e.gran$rotacao)
boxplot(e.gran$dap~e.gran$regiao)

#Avaliar normalidade
#grafico quantil-quantil =qnorm - esperados e observados
help(qqnorm)
qqnorm(e.gran$h)# plotar meus dados
qqline(e.gran$h) # comparar com esperado pela normal
# nossa, no  normal mesmo !

#Mais Caixetais
aves=file.choose()
aves.dados=read.table(aves,header=TRUE, sep=";", dec=".",as.is=TRUE)
head(aves.dados)